CAS白皮书|人工智能在化学领域的应用全景和增长机会
人工智能和机器学习在过去十年中呈指数级增长,那么化学领域如何随着这一新兴趋势发展?
2021年9月,CAS发布白皮书《Artificial Intelligence in Chemistry: Current Landscape and Future Opportunities》。
本文是CAS的信息科学家ZACH BAUM对白皮书的简要解读。
在过去的20年中,人工智能的进步,特别是机器学习,已经改变了我们进行科学研究的方式。从绘制基因组序列图和发现新抗生素,到模拟气候变化对地球的影响,甚至绘制银河系图以寻找其他类地行星,人工智能正在改变多个学科的研究。
化学就是这样的科学领域之一,在人工智能的采用方面取得了巨大飞跃。我们最新的白皮书《Artificial Intelligence in Chemistry: Current Landscape and Future Opportunities》探索了人工智能与化学之间的联系,使用我们自己的技术来描绘论文和专利的格局。我们发现了处于领先地位的采用人工智能技术的化学领域,以及那些尚未采用人工智能技术但具有巨大潜力的化学领域。
化学领域的人工智能在哪里发展
涉及人工智能的化学论文和专利数量呈爆炸式增长,从 2015 年到 2020 年期间增加了 6 倍。我们确定了贡献人工智能相关论文和专利的主要学科,并比较它们以了解哪些领域是利用这一新兴技术。人工智能应用的领先学科包括分析化学、生物化学、工业化学和化学工程,而人工智能应用机会的领域包括天然产物和有机化学(图 1)。图1|在所有学科中的AI有关论文的最高百分比
我们探索了这些论文和专利之间的关系(从 2000 年到 2020 年间),以了解使用 AI 如何帮助研究人员解决问题(图 2)。例如,在 2000 年初到 2014 年之间,人工智能论文和专利的重点从探索人类疾病诊断转移到了遗传算法,并将其应用于药物发现和 microRNA。
图 2|2000-2020 年 AI 相关化学期刊论文中同时出现的概念的演变
毫不奇怪,我们的研究还发现,小分子是人工智能出版物和专利分析的最大焦点。这些包括药物发现、逆合成和反应优化等主题,反映了制药公司通常在哪些方面进行更多投资。
化学机器学习的机会在哪里?
在我们对 70,000 多份论文的分析中,我们检查了跨学科的贡献,并指出了主要和次要学科(图 3)。这使我们能够将每个学科绘制到热图上,颜色强度反映了每个学科的贡献强度。一目了然,我们可以看到人工智能在化学领域中处于领先地位的研究领域以及那些具有未实现潜力的领域。图 3|在期刊论文中发表的跨学科研究的相对流行度
列表示主要研究领域,行表示次要研究领域,每个方块表示主要和次要研究领域的跨学科对。
例如,多学科论文在分析化学和生物化学中更为常见,其中机器学习算法被用于改进蛋白质、肽、脂质和核酸的分析,以及预测化学反应甚至发现新分子。人工智能也被广泛应用于材料科学和物理化学,这两个学科旨在预测功能材料、结构-性能关系和化学工艺优化。
在化学中采用人工智能的障碍
领先专家在我们的网络研讨会“化学中的人工智能:当前趋势和未来机遇”中讨论了采用 AI 的潜在障碍。他们确定了在化学中采用人工智能的三个主要障碍:
数据质量:最佳预测取决于稳健、高质量的数据集,这些数据集为训练提供正样本和负样本。如今,对许多组织而言,访问、规范化和准备数据是一项重大挑战。
技术:虽然计算能力(量子和基于云的方法)正在改进,但从用户的角度来看仍然存在局限性。然而,今天软件和用户界面的进步消除了编程要求,让更多的科学家能够在他们的研究中利用机器学习。
人才短缺:数据科学的人才短缺是有据可查的,化学家可能不了解今天的人工智能有多平易近人。增加化学与其他科学学科之间的合作可能有助于加速人工智能的整合。
机器学习在化学领域的发展机遇
人工智能和训练数据集被用于解决世界各地科学机构的问题和创新,为数据分析和药物发现提供了重要机会。
通过将人工智能纳入科学研究,可以解决一些最紧迫的问题,并在传统数据分析方面取得巨大进步。
参考资料
https://www.cas.org/resources/blog/artificial-intelligence-chemistry
白皮书链接
https://www.cas.org/sites/default/files/documents/ai-chemistry-landscape.pdf
--------- End ---------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【AI与化学】
●Nature|DeepMind用深度学习改进化学中的密度泛函理论
●Nat Chem|化学机器学习的最佳实践:推荐的一套标准化指南
【AI药物设计】
●CAS博客|首批进入临床试验的AI设计的候选药物:结构新颖性评估
●Drug Discov Today|人工智能增强的药物设计和开发:迈向计算型精准医学
●Drug Discov Today|用于从头药物设计的图神经网络GNN
●Nat Commun|AI结合基因表达特征,从头生成类苗头化合物
●Drug Discov Today综述|分子从头设计和生成模型
●Nat Comput Sci综述|生物分子建模在技术时代蓬勃发展